草庐IT

OpenAI Whisper论文笔记

全部标签

【论文阅读】Informer Beyond Efficient Transformer for Long Sequence Time-Series Forecasting

原始题目:Informer:BeyondEfficientTransformerforLongSequenceTime-SeriesForecasting中文翻译:Informer:超越有效变换器进行长序列时间序列预测发表时间:2021-05-18平台:ProceedingsoftheAAAIConferenceonArtificialIntelligence文章链接:https://ojs.aaai.org/index.php/AAAI/article/view/17325开源代码:https://github.com/zhouhaoyi/Informer2020摘要许多现实世界的应用都需要

【论文阅读】Sora: A Review on Background,Technology,Limitations,and Opportunities of Large Vision Models

Sora:AReviewonBackground,Technology,Limitations,andOpportunitiesofLargeVisionModels文章目录Sora:AReviewonBackground,Technology,Limitations,andOpportunitiesofLargeVisionModels概述HistoryOverviewofSoraVariableDurations,Resolutions,AspectRatiosVideoCompressionNetworkSpacetimeLatentPatchesImageDiffusionTransf

关于笔记本电脑WiFi(WLAN)图标(标志)异常消失断开解决方案

1.突然中断并消失或者开机消失WiFi图标(比较万能)这种情况多见于华为笔记本电脑和装有Win11或WIn10系统的笔记本电脑解决方案:先点击此电脑          然后选择管理         到达计算机管理界面选择服务和应用程序再选择服务最后找到WLAN开头的两个服务右键都启用就行了。除上面这种方法还有2种方法就是系统自带的诊断网络问题,用该功能或许也能解决上述情况或者重启网络适配器。重启对于这种情况一般没用。2.偶尔卡了WLAN图标,自动断开连接,过会才会显示出来,加载缓慢。这种情况多见于网卡驱动未更新异常或网卡受损关于这种情况的解决方案有很多*第一种方法就是暴力解决直接重启电脑(真出

线性代数笔记11--矩阵空间、秩1矩阵

1.矩阵空间所有的3×33\times33×3矩阵构成的空间MMM。考虑空间MMM的子空间上三角矩阵对称矩阵对角矩阵3x33x33x3矩阵空间的基:[100000000][010000000][001000000][000100000][000010000][000001000][000000100][000000010][000000001]\begin{bmatrix}1&0&0\\0&0&0\\0&0&0\\\end{bmatrix}\begin{bmatrix}0&1&0\\0&0&0\\0&0&0\\\end{bmatrix}\begin{bmatrix}0&0&1\\0&0&0\\

《Masked Image Training for Generalizable Deep Image Denoising》——CVPR23论文阅读笔记

Projectpage:https://github.com/haoyuc/MaskedDenoising前提:在捕获和存储图像时,设备不可避免地会引入噪声。减少这种噪声是一项关键任务,称为图像去噪。深度学习已经成为图像去噪的事实方法,尤其是随着基于Transformer的模型的出现,这些模型在各种图像任务上都取得了显著的最新成果。核心问题:基于深度学习的方法去噪缺乏泛化能力。如何提高深度学习去噪泛化能力,使适应更广泛的场景。方法:提出一种新的方法来提高去噪网络的泛化性能,称为掩码训练。其包括在训练期间掩蔽输入图像的随机像素并重建丢失的信息,屏蔽了自我注意层中的特征,以避免训练-测试不一致性的

有方机器人 STM32智能小车 项目学习笔记2

今天是学习有方机器人课程的第二天,通过课程复习GPIO相关知识点,很有收获,老师讲的非常好!处理器控制硬件原理处理器在日常工作时有两种功能,第一个是负责基本的数据运算和逻辑运算,第二是控制硬件外设。对于处理器来说,正常工作时需要去运行程序,而处理器本身只能运行程序,不能存储程序,程序是存储在内部的只读存储器(ROM)中,处理器如何执行程序呢?从ROM里读一条执行一条程序,程序中涉及到的运算就通过RSV来执行,运算结果的数据就存在了RAM里面;RAM和ROM最大的区别就是RAM掉电后就丢失数据,ROM掉电后不丢失,下次上电后依旧运行之前的程序。RAM:随机存取存储器(randomaccessme

【论文阅读】(DiTs)Scalable Diffusion Models with Transformers

(DiTs)ScalableDiffusionModelswithTransformers文章目录(DiTs)ScalableDiffusionModelswithTransformers论文概述DiffusionTransformers实验参考文献引用:[1]PeeblesW,XieS.Scalablediffusionmodelswithtransformers[C]//ProceedingsoftheIEEE/CVFInternationalConferenceonComputerVision.2023:4195-4205.论文链接:(ICCV2023)https://arxiv.org

【ElasticSearch - 自学笔记】

ElasticSearch1、分布式、Restful风格免费开源的搜索引擎elastic:可伸缩,灵活;search:查询的意思2、数据分为三大类:结构化数据、非结构化数据、半结构化数据2.1、结构化数据对于结构化数据,我们会用特定的结构来组织和管理数据,一般表现为二维表结构。例如:mysql、oracle,并可以通过sql语句进行查询,为了提高效率,可以采用一些索引的方式优化查询。优点:方便查询;缺点:扩展结构比较困难2.2、非结构化数据无法用二维表结构来表现数据的数据,维度广,数据量大,一般会将此类数据以key-value结构保存到NoSQL数据库中,比如Redis、MongonDB;例如

ARM MMU的学习笔记-一篇就够了

文章目录ARMV8-aarch64的MMU1、MMU概念介绍2、MMU地址翻译的过程3、在secure和non-secure中使用MMU4、在不同异常等级中使用MMU5、memoryattributes介绍6、memorytagging介绍**7、启用hypervisor**8、Accesspermissions9、MMU/cache相关的寄存器总结10、系统寄存器—TCR寄存器介绍11、代码使用示例展本文转自周贺贺,baron,代码改变世界ctw,Arm精选,armv8/armv9,trustzone/tee,secureboot,资深安全架构专家,11年手机安全/SOC底层安全开发经验。擅

视觉slam十四讲学习笔记(四)相机与图像

理解理解针孔相机的模型、内参与径向畸变参数。理解一个空间点是如何投影到相机成像平面的。掌握OpenCV的图像存储与表达方式。学会基本的摄像头标定方法。目录前言一、相机模型1针孔相机模型2畸变单目相机的成像过程3 双目相机模型4 RGB-D相机模型二、图像计算机中图像的表示三、图像的存取与访问1安装OpenCV2存取与访问总结前言前面介绍了“机器人如何表示自身位姿”的问题,部分地解释了SLAM经典模型中变量的含义和运动方程部分。本文要讨论“机器人如何观测外部世界”,也就是观测方程部分。而在以相机为主的视觉SLAM中,观测主要是指相机成像的过程。哔哩哔哩课程链接:视觉SLAM十四讲ch5_哔哩哔哩